Yiksan0315's Blog

Distance

# Tag:

  • Source/KU_ML

Distance

어떠한 Vector space 상에서 두 Data point간의 거리를 측정하는 방법.

: element 사이의 거리를 나타내는 function.

Minkowski distance of order p

두 점 사이의 거리를 일반화한 형태.

City block distance

L1 norm, 혹은 Manhattan distance 라고도 한다.

Euclidean distance

L2 norm.

Chebyshev distance

두 점 사이의 최대 자표 차이로 계산되는 거리. 각 차원의 차이 중 가장 큰 값만을 이용한다. 이동할 수 있는 모든 방향에 같은 cost가 발생한다면 유용하다.

Mahalonobis distance

데이터의 분포를 고려한 Distance 측정 방법. 데이터의 공분산을 반영하여 두 점 사이의 거리를 계산한다.

데이터가 퍼져 있는 방향과 스케일을 고려하여 계산되므로, 데이터가 비등방성(Anisotropy, 방향에 따라 성질이 다름)일 때 유용하다.

Variance가 큰 차원에서는 차이가 작게 반영되고, 작은 차원에서는 차이가 크게 반영된다. 즉, 데이터가 퍼져있는 방향에 따라 다른 거리로 계산된다.

즉, Variance의 정도를 반영하여 각 차원의 거리가 계산되므로 regularization이 이루어지게 된다.

toc test

이 페이지는 리디주식회사에서 제공한 리디바탕 글꼴이 사용되어 있습니다. 리디바탕의 저작권은 리디주식회사가 소유하고 있습니다.

This Font Software is licensed under the SIL Open Font License, Version 1.1.

Copyright 2025. yiksan0315 All rights reserved.